什么是趋动云

更新时间:

趋动云是面向 AI 算法工程师的开发训练平台,为工程师提供模型开发、模型训练、推理服务、数据和代码管理等功能。

# 算法工程师的工作流程

下图简单描述了算法工程师的工作流程。

what_flow

AI 开发的基本流程通常可以归纳为几个步骤:确定问题、准备数据和模型、训练模型、优化得出最佳模型、部署模型。

  1. 确定问题
    发现问题,明确本次 AI 开发要解决的问题,并对业务进行理解,将业务问题转化为数据问题。
  2. 准备数据和模型
    • 数据准备:主要指数据的收集和预处理,预处理包括对数据进行筛选、清洗和增强等。
    • 模型准备:您可以根据业务情况自行建模,也可从行业获取已有的基础模型。
  3. 开发调试 在开发环境中运行和调试代码、数据。
  4. 训练模型
    利用准备好的数据对模型进行训练。
  5. 优化得出最佳模型
    分析训练结果,针对分析结果对模型进行优化。
  6. 部署推理
    将模型用于部署推理,若推理过程中发现算法模型不是最优状态,则需更新数据并对模型重新训练。

# 趋动云在算法开发中的角色

趋动云作为算法工程师的开发协作平台,贯穿算法工程师工作的始终。为算法工程师提供数据管理、代码管理、镜像管理、模型训练、在线优化模型、部署推理服务等能力。主要体现在如下几个步骤中:

  • 准备数据和模型
    在该步骤中,平台为工程师提供了如下能力。

    • 数据接入、算法模型接入。
    • 数据和模型的版本管理。
  • 开发调试 在该步骤中,平台为工程师提供了如下能力。

    • 代码调试:在平台内开发环境中可对代码、数据进行调试。
    • 保存开发环境:可将开发环境保存为新镜像,在后续训练、推理服务中使用。
  • 训练模型
    在该步骤中,平台为工程师提供了如下能力。

    • 离线训练:平台中的离线训练,在训练结束后会立即释放资源,极大的保证了资源的可持续利用。
    • 灵活的训练环境选择:在实际开发和训练过程中,训练结果常会因为训练环境和开发环境的差异而有所不同,平台通过对镜像的管理,使得工程师能够灵活的选择训练环境和开发环境。
  • 优化得出最佳模型
    平台为工程师提供了在线的开发环境,内置多种 AI 算法库和开发工具,工程师可以在线编辑优化模型。另外在开发环境中,工程师可随时提交训练任务,在线训练和分析,实时进行模型优化。

  • 部署推理服务
    在该步骤中,平台为工程师提供了如下能力。

    • 快捷创建推理服务:尤其是在平台内进行了开发调试和训练时,可以基于调优结果,一键创建推理服务;如果已有镜像,无需在平台内继续调优,也可用其直接提交推理服务。
    • 扩缩容:支持根据业务运行情况,随时手动扩缩容或设置定时扩缩容策略。
    • 支持升级和回滚推理服务。